Construction et enrichissement automatique d'ontologie à partir de ressources externes
نویسندگان
چکیده
La construction automatique d’ontologies à partir de textes est généralement basée sur le texte proprement dit, et le domaine décrit est circonscrit au contenu du texte. Afin de concevoir des ontologies sémantiquement plus riches, nous proposons d’étendre les méthodes classiques en matière de construction d’ontologie (1) en prenant en compte le texte du point de vue de sa structure et de son contenu pour construire un premier noyau d’ontologie, et (2) en enrichissant l’ontologie obtenue en exploitant des ressources externes (textes grand public et vocabulaires contrôlés du même domaine). Ce papier décrit comment ces différentes ressources sont analysées et exploitées. Nous avons appliqué cette méthode sur des textes géographiques et avons évalué le bénéfice induit par une ontologie plus riche (par rapport à une première taxonomie du domaine) dans le contexte du typage des entités nommées spatiales. Les résultats ont été améliorés de façon significative.
منابع مشابه
Une approche combinée pour l'enrichissement d'ontologie à partir de textes et de données du LOD
Résumé. Cet article porte sur l’étiquetage automatique de documents décrivant des produits, avec des concepts très spécifiques traduisant des besoins précis d’utilisateurs. La particularité du contexte est qu’il se confronte à une triple difficulté : 1) les concepts utilisés pour l’étiquetage n’ont pas de réalisations terminologiques directes dans les documents, 2) leurs définitions formelles n...
متن کاملConstruction d'une ontologie à partir d'une base de données relationnelle : approche dirigée par l'analyse des formulaires HTML
RÉSUMÉ. L’émergence et la généralisation du Web dans tous les domaines, a permis à de nombreuses entreprises d’offrir une variété de services et d’informations en ligne, suscitant ainsi un réel besoin de partage et d’interopérabilité. Cela nécessite une infrastructure permettant à des agents logiciels d’exploiter, de composer et de raisonner sur les contenus constituants les ressources Web. Mal...
متن کاملAnalyse comparative de méthodologies et d'outils de construction automatique d'ontologies à partir de ressources textuelles
HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...
متن کاملEnrichissement sémantique de documents XML représentant des tableaux
Résumé. Ce travail a pour objectif la construction automatique d’un entrepôt thématique de données, à partir de documents de format divers provenant du Web. L’exploitation de cet entrepôt est assurée par un moteur d’interrogation fondé sur une ontologie. Notre attention porte plus précisément sur les tableaux extraits de ces documents et convertis au format XML, aux tags exclusivement syntaxiqu...
متن کاملPeuplement automatique d'ontologie à partir d'un catalogue de produits
HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- CoRR
دوره abs/1002.0239 شماره
صفحات -
تاریخ انتشار 2009